Exploitation de dictionnaires électroniques pour la désambiguïsation sémantique lexicale

نویسندگان

  • Caroline Brun
  • Bernard Jacquemin
  • Frédérique Segond
چکیده

RÉSUMÉ. Cet article présente un système de désambiguïsation lexicale sémantique, conçu initialement pour l’anglais et à présent adapté à la désambiguïsation du français. La méthodologie développée repose sur l’utilisation d’un dictionnaire électronique comme un corpus sémantiquement étiqueté afin d’en extraire une base de règles de désambiguïsation sémantique. Ces règles permettent d’associer à un mot son sens compte tenu de son contexte. L’extraction et l’application des règles sont décrites en détail ainsi que l’évaluation du système. L’évaluation des résultats obtenus pour le français nous conduit à considérer un ensemble de perspectives concernant les ressources lexicales qui seraient les mieux adaptées à la tâche de désambiguïsation dans le cadre de cette méthodologie.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

A State of the Art of Word Sense Induction: A Way Towards Word Sense Disambiguation for Under-Resourced Languages

______________________________________________________________________________________________ Word Sense Disambiguation (WSD), the process of automatically identifying the meaning of a polysemous word in a sentence, is a fundamental task in Natural Language Processing (NLP). Progress in this approach to WSD opens up many promising developments in the field of NLP and its applications. Indeed, ...

متن کامل

Encodage des dictionnaires electroniques: problemes et propositions de la tei

Résumé Cet article décrit les principaux problèmes auxquels la Text Encoding Initiative (TEI) a dû faire face pour définir un standard d'encodage des dictionnaires électroniques. Ceux-ci sont, à cause de leur haut degré de structuration et de complexité, parmi les types de textes les plus difficiles traités par la TEI. Les problèmes les plus délicats étaient (1) le conflit entre la généralité d...

متن کامل

Vers un modèle d'indexation sémantique adapté aux dossiers médicaux de patients

This paper presents a semantic model adapted for the indexing of electronic patient records (EHRs) as a support to the process of finding medical information. Given the specificity of such documents, the indexing is based on the sequence of Natural Language Processing steps: semantic annotation based on the use of the MeSH (Medical Subject Headings) thesaurus, concept disambiguation, extraction...

متن کامل

Nommage de sens à l’aide des vecteurs conceptuels Word Sense Naming with Conceptual Vectors

Dans le cadre de la recherche en sémantique lexicale, nous utilisons le modèle des vecteurs conceptuels pour représenter les aspects thématiques des mots. La base vectorielle est construite à partir de définitions provenant de différentes sources lexicales, ce qui permet statistiquement de tempérer les diverses incohérences locales. Pour désigner le sens obtenu après un regroupement des définit...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • CoRR

دوره abs/cs/0506049  شماره 

صفحات  -

تاریخ انتشار 2005